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© Verfahren zur Mehrsprachenverwendung eines hidden Markov Lautmodelles in einem 
Spracherkennungssystem 

© Mit der Erfindung wird oins Method o zur Bestimmung der 
Ahnlichkeiten von Lauten uber verschiedane Sprachen hin- 
weg angegaben. Weiterhin wird ein neuer Ansatz zur hidden 
Markov Modellierung von muttilingualen Phonemen angege- 
ben. Bei der vorgeschlagenen Methods zur akustisch phone- 
tischen Modellierung werden sowohl sprachspezifische sis 
auch sprachunabhingige Eigenschaften bei der Zusammen- 
fassung der Wahrscheinlichkertsdlchten fur unterschiedliche 
hidden Markov Lautmodelle in verschiedenen Sprachen 
angegaben. 
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Die Erfindung bezieht sich auf hidden Markov ModeDe fQr Spracherkennungssysteme, w bei ein solches 
Modell fur mehrere Sprachen herangezogen werden soil indem die akustischen and phonetischen Ahnlichkehen 
zwischen den unterschiedlichen Sprachen ausgenutzt werden. 
Ein Spracherkennungssystem fur mehrere Sprachen ist aus der WO 95/02879 Al bekannt 
Bei der Spracherkennung besteht ein groBes Problem darin, daB fur jede Sprache in welche die Spracherken- 
nungstechnologie eingefuhrt werden soQ, neue akustisch phonetische Modeile trainiert werden mQssen am eine 
Landeranpassung durchfuhren zu kdnnen. Meistens werden bei gangigen Spracherkennungssystemen hidden 
Markov Modeile zur Modellierung der sprachspezifischen Laute verwendet Aus diesen stattstisch modeffierten 
Lautmodellen werden im AnschluB akustische Wortmodelle zusammengefugt welche wihrend eines Suchpro- 
zesses beim Spracherkennungsvorgang erkannt werden. Zum Training dieser Lautmodelle werden sehr umfang- 
reiche Sprachdatenbanken bendtigt, deren Sammlimg and Aufberehung einen auBerst kosten- und zehintensi- 
ven Prozefi darstelit Hierdurch entstehen NachteQe bei der Portierang einer Spracherkennungstechnofogie von 
einer Sprache b eine wehere Sprache, da die Erstelhing einer neuen Spradidatenbank einerseits eine Verteue- 
nmg des Produktes bedeotet und andererseits eine zeitliche Verzogerung bei der MarlrteinfQhrung bedingt 

In gangigen erwerbbaren Spracherkennungssystemen werden ausscfalieBhch sprachspezifische Modeile ver- 
wendet Zur Portierung dieser Systeme in eine neue Sprache werden umfangreiche Sprachdatenbanken gesam* 
melt und aufbereitet AnschlieBend werden die Lautmodelle fQr die neue Sprache mh diesen gesammelten 
Sprachdaten von Grand auf neu trainiert 

Urn den Aufwand und die Zertverzdgerung bei der Portierung von Spracherkennungssystemen in unter- 
schiedEche Sprachen zu verringern, soQte also untersucht werden, ob einzelne Lautmodelle fQr die Verwendung 
in verschiedenen Sprachen geeignet sind Hierzu gibt es in [2] bereits Ansitze mehrsprachige iAntrgodftlle zu 
erstellen und diese bei der Spracherkennung in den jeweihgen Sprachen einzusetzen. Dort werden audi die 
Begriffe Poly- und Monophoneme eingefuhrt Wobei Poiyphoneme Laute bedeuten, deren Lautbildungseigen- 
schaften uber mehrere Sprachen hinweg ahnltch genug sind, um gieichgesetzt zu werden. Mit Monophonemen 
werden Laute bezeichnet welche sprachspezifische Egenschaften aufweisen. Um fur solche Entwicklungsarbei- 
ten und Untersuchungen nicht jedesmal neue Spradidatenbanken trainieren zu mfissen, stehen solche schon als 
Standard zur Verfugung [6J [4J [7} Ein weiterer Stand der Technik zur mehrsprachigen Verwendung von 
Lautmodellen ist nicht bekannt 

Die der Erfindung zugrundeliegende Aufgabe besteht demnach darin, ein Verfahren zur Mehrspradienver- 
wendung eines hidden Markov Lantmodelles in einem Spracherkennungssystem anzugeben, durch welches der 
Portierungsaufwand von Spracherkennungssystemen in eine andere Sprache ininimiert wird, indem die Parame- 
ter in einem multQingualen Spracherkennungssystem rednziert werden. 

Diese Aufgabe wird gemaB den Merkmalen der PatentansprOche 1 und 6 geldst 

Weiterbildungen der Erfmdung ergeben sich aus den abhangigen AnsprOchen. 

Ein besonderer Vorteil des erfindungsgemaBen Verfahrens besteht darin, daB ein statistisches Ahnlidikeits- 
maB angegeben wird, welches es erlaubt, aus einer gegebenen Anzahl von verschiedenen Lautmodellen fQr 
ihnfidie Laute in unterschiedlichen Sprachen dasjenige LautmodeO auszuwaJiIen, welches in seiner Charakteri- 
stikaflezur Verfugung stehenden Merkmalsvektoren der jeweihgen Laute am besten beschreibt 

Besonders vorteQhaft wird als MaB fQr die Auswahl des besten hidden Markov Modelles fQr unterschiedliche 
Lautmerkmalsvektoren der logarithmiscfae Wahrsdieinfichkeitsabstand zwischen den jeweOigen hidden Mar- 
kov Modellen und einem jeden Merkmalsvektor ennhtelt Hierdurch wird ein Mafi zur Verfugung gestellt 
welches expenmentefle Befunde bezugiich der AhnlichkeH von einzelnen Lautmodeflen und deren Erkennungs- 
raten widerspiegelt 

Besondos vorteuTiaft wird als MaB fur die Beschreibung eines mpgUchst reprasentativen hidden Markov 
LautmodeUes nach der Erfmdung der arithmetische Mittelwert der iogarithmischen Wahrscheinnchkeitsabstan- 
de zwischen jedem hidden Markov Modell und den jeweiligen Merkmalsvektoren gebfldet, da hierdurch ein 
symmetnscher Abstandswert erhalten wird. 

A^rteilhaft wird das erfindungsgemafie BeschreibungsmaB fur die reprasentative Eigenschaft eines hidden 
Markov Modells zur Beschreibung von Lauten in unterschiedlichen Sprachen dadurch gebildet, daB die erfin- 
dungsgemaBen Gleichungen 1 bis 3 angewendet werden, da hierdurch ein geringer Redienaufwand entsteht 

Besondws vorteilhaft wird fQr die erfindungsgemafle Anwendung eines BeschreibungsmaBes eine Schranken- 
bedmgung vorgegeben, mh der eine Erkennungsrate des reprasentierenden hidden Markov Modells eineesteQt 
werden kann. 

Bwonders vorteilhaft wind durch das erfindungsgemaBe Verfahren der Speicheraufwand ffir eine Sprachbi- 
bhothek reduaert, da ein Modell fur mehrere Sprachen verwendet werden kann und ebenf alls der Partierungs- 
aufwand von einer Sprache in die andere minimiert, was einen reduzierten Zeitaufwand fQr die Portierung 
bedingt Ebenso vorteilhaft wird ein geringerer Rechenaufwand bei der Viterbi-Suche ermdglicht da beispiels- 
weise bei mehrsprachigen Eongabesystemen weniger Modeile QberprQft werden mQssen. 

Besonders vorteilhaft werden bei der Erfindung besondere hidden Markov Modeile zur Verwendung in 
mehrsprachigen Spracherkennungssystemen generiert Durch die erfindungsgemaBe Vorgehensweise kdnnen 
hidden Markov Lautmodelle fur Laute in mehreren Sprachen zu Pdlyphonem-Modellen zusammengefafit 
werden. Hierzu werden Uberiappungsbereiche der verwendeten Standardwahrscheinlichkeitsdichteverteilun- 
pn bei den unterschiedlichen Modellen untersucht Zur Beschreibung des Poryphonem-ModeUes kann eine 
behebige Anzahl von identisch bei den unterschiedlichen Modellen verwendeten Stand^wahrscheinlichkehs- 
dichtevwteUungen herangezogen werden. ExperimenteUe Befunde haben gezeigt daB vorteilhaft auch mehrere 
Standardverteilungen aus unterschiedlichen SprachmodeDen verwendet werden kdnnen, hnedaBdi hierdurch 
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bewirkte Verwischung der einzeinen Sprachcharakteristika zu einer rignifikant niedrigeren Erkennungsrate 
beim Einsatz dieses Modells fuhren wtirde. Als besonders vorteilhaft hat sich hier der Abstandsschwellenwert 
fflnf zwischen ihnlichen Standardwahncheinltehkeitsverteflimgsdichten bewihrt 

Besonders vorteilhaft werden beim Einsatz des erfindungsgem&Ben Verfahrens die hidden Markov ModeHe 
mit drei Zustanden aus Anlant, Mitteliaut and Ablaut modeOiert, da hierdurch eine hinrachende Genairigkeit bei 5 
der Beschreibimg der Laute erzielt wird und der Rechenaufwand bei der Erkennung in einem Sprache r k en ncr 
geringbleibt 

Fig. 1 zeigt dabei beispielhaft den Aufbau eines einzigen Multilingualen Phonemes. In diesem Fall ist es das 
Phonem M was dargestellt wird Die Zahl der Wahrerfiemlichkeitsdmhten und die Erkennungsrate fQr dieses 
PhonemsindinTabeIle4angegebeiL to 



Thr . 


#densit(a,b, c) . 


Engl.r%] 


6ezm.[%] 


Span.[%] 


0 


341(0 0 341) 


46.7 


44.7 


59.4 


2 


334(0 14 327) 


45.0 


46.4 


57.5 


3 


303(27 34 280) 


48.0 


45.8 


57.5 


4 


227(106 57 187) 


50.9 


44.1 


58.7 


5 


116(221, 48,72} 


49.3 


43.1 


57.0 


6 


61(285, 22, 34) 


41.2 


38.6 


50.4 



In Fig. 1 ist der Anlaut L, der Mittel laut M und der Ablaut R des Phonem-Modelles dargestellt Fur die 
unterschiedlichen Sprachen Englisch EN, Deutsch DE und Spanisch SP and die Schwerpunkte der Wahrschein- 
lichkeitsdichteverteflungen der einzelnen verwendeten Standardwahrscheinlichkeitsdichten eingetragen und als 
WD gekennzeichnet Hier ist beispielsweise ein hidden Markov Modell aus drei Teflzustanden dargestellt Die so 
Erfindung soil jedoch nicht lediglich auf solche hidden Markov Modelle beschrankt werden, obwohl diese unter 
BerGcksichtigung des Kriteriums, das ein minimaler Rechenaufwand der Erkennung durchgefuhrt werden soil 
ein gewisses Optimum darstellen. Die Erfindung kaim ebenso auf hidden Markov ModeHe angewendet werden, 
die eine andere Anzahl von Zustinden aufweisen. Durch die Erfindung soil insbesondere erreicht werden, daB 
der Portierungsaufwand bei der Portierung von Spracherkennungssystemen in eine andere Sprache reduziert 35 
wird und daB die verwendeten Rechenressourcen durch Reduktion der zugrundeliegenden Parameter mdglichst 
gering gehalten werden. Beispielsweise kdnnen durch derartige Spracherkennungssysteme begrenzte Hardwa- 
reerfozdernisse besser erfQHt werden, insbesondere wenn ein- und dasselbe Spracherkennungssystem fOr Mehr- 
sprachenanwendung in einem Gerat zur Verfugung gesteDt werden soU. 

Zun&chst sollte urn das Zid der Erfindung zu erreichen, die Ahnlichkeiten von Lauten in unterschiedlichen 40 
Sprachen auszuschopfen und beim Modellieren zu berOcksichtigen, beachtet werden, daB sich die Phoneme in 
verschiedenen Sprachen unterscheiden kdnnen. Die Grfinde hierfur bestehen vor alien Dingen in: 

— Unterschiedlichen phonetischen Kontexten, wegen der unterschiedlichen Phonemsatze in den verschie- 
denen Sprachen; 45 

— unterechiedlichen Sprechweisen; 

— verschiedenen prosodischen Merkmalen; 

— unterschiedlichen allophonischen Variationen. 

Ein besonders wichtiger Aspekt, welcher dabei zu berucksichtigen ist, besteht im Prinzip der genugenden so 
wahroehmungttechnischen Unterscheidbarkeit der Phoneme [5} Dies bedeutet, daB einzelne Laute in verschie- 
denen Sprachen akustisch unterscheidbar gehalten werden, so daB es fur den einzelnen Zuhdrer leichter ist sie 
voneinander zu separieren. Da aber jede einzelne Sprache einen unterschiedlichen Phonemschatz hat, werden 
die Grenzen zwischen zwei ihnlichen Phonemen in jeder einzelnen Sprache sprachspezifisch festgelegt Aus 
diesen Grfinden hat die Auspragung eines bestimmten Lautes eine sprachspezifische Komponente. ss 

Bevorzugt werden (fie Phoneme mittels kontinuierGchen dichten hidden Markov ModeUen (GD-HMM) 
modeDiert [3], Als dichte Funktionen werden haufig Laplace-Mischungen benutzt Bevorzugt besteht dabei jedes 
einzelne Phonem aus drei Zustanden von links nach rechts gerichteten HMM. Die akustischen Merkmalsvekto- 
ren bestehen dabei beispielsweise aus 24 mel-skalierten cepstral 12 delta cepstral, 12 delta delta cepstral, 
Energie, delta-Energie und delta deita-Energie-Koeffiziettten. Beispielsweise wind als Lange des Untersuchungs- 60 
zeitfensters 25 ms gewihlt, wobei die Rahmenabstande 10 ms zwischen den einzelnen Rahmen betragen. Aus 
Grunden der begrenzten GrdBe des Sprachkorpus werden bevorzugt lediglich kontextunabhsingige Phoneme 
generiert Als bes nders representatives Phonemxnventar wurde jenes aus [4] gewahlt 

Die Idee der Erfindung besteht dabei darin, daB zum einen ein Ahnlichkeitsmafi zur Verfugung gestellt wird, 
urn aus standardmSBig verfugbaren Sprachphonembibliotheken fur unterschiedliche Sprachen jenes hidden ss 
Markov Modell auswahlen zu kdnnen, welches den Merkmalsvektoren, die aus den unterschiedlichen Lautmo- 
dellen der unterschiedlichen Sprachen abgelehet werden, am nSchsten kommt Hierdurch ist es mdglich, die 
Ahnlichkehen zweier Phonem-Modelle zu ermitteln und fiber dieses AhnlichkeitenmaB basierend auf der 
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Differenz der Log-Likelihood-Werte zwischen den Lautreafisierungen und LautmodeUen eine Aussage zu 
treffen, ob es sich lohnt, einen Laut fur mehrere Sprachen gemeinsam zu modellieren, bzw. em betreffendes 
schon bestehendes hidden Markov Modell fur die Modellierung des Lautes in mehreren Sprachen zu verwenden. 
Hierdurch wird die Zahl der Parameter, welche bei der Spracherkennung zu berucksichtigen sind reduziert, 
indem die Zahl der zu untersuchenden hidden Markov Modelle reduziert wird. 

Ein zwetter Losungsansatz der Erfmdung besteht darin, ein spezieUes Poiyphonem-Modell zur Modeutenmg 
eines Lautes in mehreren Spradien zu erstelien. Hierzu werden zunachst beispielsweise dret Lautsegmente, in 
Form eines Anlautes, Mittellautes und Ablautes gebildet, deren 7*i*ta™*» aus mehreren Wahrscheinlicfakeits- 
dichtefunktionen den sogenannten Mischverteilungsdichten mit den dazugehorigen Dichten bestehen. Diese 
Dichten der fiber verschiedenen Sprachen ahnlichen Lautsegmente werden zu einem multiingualen Codebuch 
zusammengefefit Somit teilen sich Lautsegmente verschiedener Sprachen die gleichen Dichten, Wahrend das 
Codebuch fur mehrere Sprachen gieichzeitig benutzt werden kann, werden beispielsweise die Gewichte, mtt 
denen die Dichten gewichtet werden fur jede Sprache getrennt ermittelL 

Zur Bildung eines geeigneten Ahnfichkehsmafies werden bevorzugt hidden Markov Modefle mh drei Zustan- 
den herangezogen. Das Abstands- oder AhnlichkehsmaB kann dabei benutzt werden urn mehrere Phonem-Mo- 
deQe zu einem mululingualen Phonem-Modefl zusammenzufassen oder diese auf geeignete Weise zu ersetzen. 
ffierdureh kann ein multflingu^er Phonemschatz entwickeh werden. Bevorzugt wird zur Messung des Abstan- 
des bzw. zur Bestimnuing der Ahnlichkeit von zwei Phonem-Modeflen des selben Lautes aus untersduedBchen 
Sprachen eine MeBgroSe verwendet, welche auf der relauven Entropie basiert [lj Wahrend des Trainings 
werden dabei die Parameter der gemischten Laplacedichteverteflungen der Phonem-ModeDe bestimmt Wdter- 
hm wird fur jedes Phonem ein Satz von Phonemtokens X als Merkmalsvektor aus einem Test- oder Entwick- 
lungssprachkorpus extrahiert Diese Phoneme konnen dabei durch ihr international genormtes phonetisches 
Etikett maridert seia GemaB der Erfmdung werden zwei Phonem-Modelle X* und Xj und ihre zugehdrigen 
Pbonemtoken Xi und Xj zur Besthnmung des AhnlichkeitsmaBes zwischen diesen unterschiedlichen Phonemen 
wie f olgt behandelt 

d(XiXi) - logpPQIXO - logppQlXi) (1) 

Dieses ; AbstandsmaB kann als Log-likefihood-Abstand angesehen werden, welcher darsteflt wie gut zwei 
verschiedene Modelle zu dem selben Merkmalsvektor X! passen. DemgemaB wird der Abstand zwischen den 
beioen Modelien Xi und Xj gemaB: 

d(XiXd . logppCjIXj) - logppCj|X0 (2) 

bestimmt Urn einen symmetrischen Abstand zwischen diesen beiden Phonem-Modeflen zu erhalten, wird dieser 
bevorzugt gemaB 



b«timint Anhand von expOTmenteflen Befunden konnte festgestellt werden. daB sich durcfaaus emige Phonem- 
Modelle aus anderen Sprachen besser for die Verwendung in einem deutschen Spracherkennangssystem eienea 
ab em deutsches Phonem-ModelL Beispielsweise gilt dies fur die Phoneme k. p and N. Far diesePhonemeeS 
sich das engfische Phonem-ModeU besser als das deutsche. Wahrend beispielsweise ein groBer Umerschied 
rwischen dem deutschen und dem engiischen ModeU fiber den Umlaut aU beobachtet wurde,was bedeutet daB 
fur beide Laute em unterschiedliches Symbol im multflmgualen Phonemschatz eingefuhrt werden sollte. Ande- 
rerserts konnte fur den Umlaut al im deutschen und im engiischen ebe groBe Ahnficfakeit festgestellt werden, das 
bedeutet, daB led.guch ein Phonem-Modefl fQr beide Sprachen gleich gut Verwendung fmden kann. Ausgehend 
davon soltte fur jedes Symbol ernes multflingualen Phonemschatzes ein separates statistisches Modell ozeugt 
werden. In [6] warden Polyphoneme als solche Phoneme bezeichnet, die ahnfich genug and, urn in verschiedenen 
Sprachen als em empges Phonem modeUiert zu werden. Ein Nachteil dieser Vorgehensweise besteht darin. daB 
ffir die sprachspeafische Erkennung der vollstandige akustische Raum des Polyphonems verwendet wild. Die 
Erfmdung hat es jedoch zum Hel, die spracfaabhingigen und die sprachspezifischen akustischen Eigenschaften 
ernes multflingualen Modelk zu kombinieren. GemaB der Erfmdung sollen in einem Poryphonem-Modell solche 
Bereiche des akusdschen Raumes eingegrenzt werden, in denen sich die verwendeten Wahrscheinfichketedich- 
ISLtT C ^^ ne P P . hone 5 e Oberlappen. Hierzu wird z. B, eine gruppierende Verdicitungstechnik (agglommera- 
nve density clustering technique) eingesetzt, urn gleiche oder ahnDche Auspragungen ehws Phonemsru reduzie- 
I ?L i *EE m 5f beachten, daB lediglich die Dichten der korrespondierenden Zustinde der 

eiazelnen hidden Markov Modelle in den Phonemen zusammengefaBt werden dflrfeiL 

In Fig. 1 ist dabei zu erkennen, daB die jeweuigen Dichten for die einzelnen Zustinde L, M und R in den 
emgegrenzten Regionen enthalten sind. Wahrend identische Dichten Cber die einzelnen Sprachen EN, DE, und 
S^L^ ^e^ 0 ffeM«Jungsgewichte sprachabhangig. Bei dieser Bewertung soflte jedoch auS 
Sr^uSTt^Sf s P e2rfisch e Auspragungen eines Phonems in verscMedenen S^en m unte^hiS 

^I^T^^ der "Otowhiedlichen WahrschemBchkeitsdichten kann dabei mit einem unterschiedB- 
chen Abstandsschweuenwert fur die Walirscheinlichkeitsdichten bei der Dichtehaufung (density duster^) 
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durchgefQhrt werden. Beispielsweise wurde mit einem AbstandsschweDenwert von fQnf die Zahl der verwende- 
ten Dichten urn einen Faktor 3 gegenQber dem Ausgangszustand reduziert, ohne damit eine entscheidende 
Verschlechtenxng bei der Spracherkennungsrate einher ging. In diesem Fall wurden 221, 48 und 72 von den 
ursprfinglichen 341 Ausgangsdichten fQr jeweQs die Polyphonem-Region, die Zweisprachen-Region und die 
Einsprachen-Region zusammengefafit In Fig. 1 ist eine solche Polyphonemregion als Schnhtmenge der Kreise 5 
fur die einzelnen Sprachen dargesteUt Beim Mhtellaut M des dargesteHten hidden Markov Modells ist beispiels- 
wetse eine Wahrscheinlichkeitsdichte in einer solchen Region als WDP bezeicfanet Die Erkennungsraten fQr em 
komplettes multilinguales Spracherkennungssystem sind dabei in Spalte 4 und 5 der Tabelle 2 als ML1 und ML2 
angegeben. 



Language 


#Tokens 


LDP[%] 


ML1[%] 


ML2[%] 


English 


21191 


39.0 


37.3 


37.0 


German 


9430 


40.0 


34.7 


37.7 


Spanish 


9525 


53.9 


46.0 


51.6 


Total 


40146 


42.8 


38.8 


40.8 



Wahrend bei der ersten Untersuchung ML1 die konventioneDe Poryphonem-Definhion aus [6J verwendet 
wurde, was bedeutet daB der komplette akustiscbe Bereich des Polyphonem-Modells bestehend aus der auBeren 
Kontur der Sprachbereiche in Fig. 1, fur die Erkennung verwendet wurde, benutzt die erfindungsgemaBe 
Methode lediglich einen Teilbereich daraus. Indem die teilweise Oberlappung der einzelnen Sprachbereiche fflr 2s 
die einzelne ModeDierung des Polyphonem-Modells herangezogen wird, ist beispielsweise eine Verbessenmg 
von 2% erzielbar, wie dies in Tabelle 2 in der Spalte fQr ML2 dargestellt ist 
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Patentanspruche 

45 

1. Verfahren zur Mehrsprachen Verwendung ernes hidden Markov Lautmodelles in einem Spracherken- 
nungssystem, 

a) bei dem ausgehend von mindestens einem ersten Merkmalsvektor fflr einen ersten Laut QUMJR) in 
einer ersten Sprache (SPJiNJDE) und von mindestens einem zweiten Merkmalsvektor fQr einen ver- 
gleichbar gesprochenen zweiten Laut in mindestens einer zweiten Sprache (DE£P,EN) und deren 50 
zugehdrigen ersten und zweiten hidden Markov Lautmodellen, ermittelt wird welches der beiden 
hidden Markov Lautmoddle (LMR) beide Merkmalsvektoren besser beschreibt, 

b) und bei dem dieses hidden Markov LautmodeH (L*MJt) fur die ModeHierung des Lautes in minde- 
stens beiden Sprachen (SP,EN,DE) verwendet wird. 

2. Verfahren nach Anspruch 1, bei dem als MaB fur die Beschreibung etnes Merkmalsvektors durch em 55 
hidden Markov LautmodeH (I+K(R) der togarithmische Wahr^hftinKr>hV ff ittgahstffn^ als log likelihood dist- 
ance zwischen jedem hidden Markov LautmodeH und mindestens einem Merkmalsvektor gebildet wird, 
wobei eine kurzerer Abstand eine bessere Beschreibung bedeutet 

3. Verfahren nach Anspruch % bei dem als MaB fur die Beschreibung der Merkmalsvektoren durch die 
hidden Markov LautmodeHe der arithmetische Mittetwert der togarithmischen Wfthrg^hpmTiohif«*yt?^b?t§n- go 
de bzw. der log likelihood distances zwischen jedem hidden Markov Lautmodeil (UMJl) und jedem 
jeweiligen Merkmalsvektor gebOdet wird, wobei eine kurzerer Abstand eine bessere Beschreibung bedeu- 
tet 

4. Verfahren nach Anspruch 3, bei dem das erste hidden Markov Lautmodeil (LMR) von einem Phonem Xi 
und das zweite hidden Markov Lautmodeil von einem Phonem Aj verwendet wird und bei dem als erste und 65 
zwehe Merkmalsvektoren Xi und Xj verwendet werden, wobei der togarithmische Wahrscheinlichkehsab- 
stand zum ersten Merkmalsvektor gemaB 
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bestimmt wird und der logarithmische W«liT«rft»iiittr4iV T fr«ah« tnn<f mm zwehen Merkmalsvektor gemiB 
dtX^XO - bgppCjfo) - IogpCXjlXi) (2) 

bestimmt wird, wobei zur Erzielung eines symmetrischen AbstandsmaBes der aritbmetische Mhtelwert zn 



15 5. Verfahren nach Anspntch 4, bei don dieses hidden Markov Lautmodell (LMR) for die Modeflierung des 
Lautes in mindestens beiden Spracben nur verwendet wird, falls d(Xj^) eine festgelegte «nh™lr*>t»br^n- 
gungerfuOt 

6. Verfabren zur Mehrsprachenverwendung eines hidden Markov LautmodeQes in einem Spracherken- 
nungssystem, 

20 a) bei dem ausgehend von mmdmens einem ersten hidden Markov Lautmodell (LMR) fur einen 

ersten Laut in einer ersten Sprache (SP 9 Er^DE) and von mindestens einem zwehen bidden Markov 
Lautmodell (UHR) fur einen vergleichbar gesprochenen zweiten Laut in mindestens einer zwehen 
Sprache (DE5P.EN), ein Poly Phonem ModeQ derart gebildet wird, daB die fur die ModeQierung des 
ersten und zwehen hidden Markov LautmodeHes (L»MJt) verwendeten StandaMwahrscheinlicfakehs- 

25 verteflungen (WD) bis zu einem festgelegten AbstandsschweQenwert, der angibt bis zu welcbem 

mazimalen Abstand zwischen zwei Stand^rdwahrscheinHchkeitsverteilungen (WD) diese zusammen- 
gefugt werden soQen zu jeweils einer neuen Standanlwahndieinfichkeitsverteilung (WDP) zusammen- 
gefQgt werden und lediglich die zusammengefugten Standardwabrsdidiuichkeitsverteilungen das Poly 
Phonem ModeQ charakteristeren 

so b) und bei dem dieses Poly Phonem ModeQ fur die ModeQierung des Lautes in mindestens beiden 

Sprachen (D3 SPJ5N) OUMJt) verwendet wird 

7. Verf ahren nach Anspruch 6, bei dem als AbstandsschweQenwert 5 f estgelegt wird 

& Verfabren nach einem der vorangehenden AnsprOche bei dem hidden Markov LautmodeQe mh drei 
Zustanden verwendet werden, welche aus den Lautsegmenten Anlaut, MftteQaut und Ablaut gebildet 
35 werden. 



Hierzu 1 Seite(n) Zeichnungen 



40 



45 



50 



55 



60 



65 



6 



- Leerseite - 




702 127/405 



